Notre projet porte sur la représentation des Airbnb au sein de grandes villes européennes, plus particulièrement sur le prix de location des biens imobiliers renseignés sur l’application. Notre travail comporte deux parties. Dans la première, nous tenterons d’expliquer les différences de prix entre les logements et, dans la deuxième, nous nous intéresserons à la représentation graphique de la répartition des biens.
Nos données proviennent du site kaggle : https://www.kaggle.com/datasets/thedevastator/airbnb-prices-in-european-cities
Nous disposons du prix des locations la semaine et le week-end pour 10 villes européennes.
| prix_moyen | période |
|---|---|
| 270.86 | Semaine |
| 276.33 | Weekend |
Il est clair que les Airbnb sont plus chers le week-end. On cherche alors à quantifier l’influence de plusieurs variables explicatives sur le prix des Airbnb. Plus précisément, nous cherchons les variables qui permettent d’expliquer les différences de prix entre la semaine et le week-end. Nous avons fait le choix de limiter la taille de l’échantillon car, dans la base de données, il y a une trentaine de logements dont le coût de location dépasse les 8 000€, ce qui compromet la comparaison.
Nous allons à présent modéliser le prix des logements en fonction des variables suivantes:
Les maisons et les appartements privés sont logiquement plus chers que les chambres privées et les chambres partagées. En général, plus un bien est cher en semaine, plus il sera cher le week-end. On observe que plusieurs logements ne proposent pas de location le week-end.
D’après les matrices de corrélation, il n’y a pas de différence significative entre les corrélations des variables la semaine et le week-end.
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | 208.0888913 | 24.9287917 | 8.347332 | 0.0000000 |
| room_typePrivate room | -100.1301521 | 5.1665056 | -19.380633 | 0.0000000 |
| room_typeShared room | -176.1526713 | 24.9145960 | -7.070260 | 0.0000000 |
| person_capacity | 3.7584001 | 2.3031164 | 1.631876 | 0.1027176 |
| host_is_superhostTrue | -36.9849807 | 5.0332327 | -7.348156 | 0.0000000 |
| cleanliness_rating | -4.4837857 | 3.1759480 | -1.411794 | 0.1580223 |
| bedrooms | 85.9268580 | 4.2098371 | 20.410970 | 0.0000000 |
| guest_satisfaction_overall | 0.5108604 | 0.3369012 | 1.516351 | 0.1294426 |
| metro_dist | -31.9233201 | 3.0961241 | -10.310737 | 0.0000000 |
| dist | 6.2195975 | 1.0834416 | 5.740593 | 0.0000000 |
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | 237.0565123 | 20.5103482 | 11.5578980 | 0.0000000 |
| room_typePrivate room | -90.7245344 | 4.2507808 | -21.3430281 | 0.0000000 |
| room_typeShared room | -165.4936406 | 20.4986686 | -8.0733849 | 0.0000000 |
| person_capacity | 3.2180134 | 1.8949061 | 1.6982443 | 0.0894735 |
| host_is_superhostTrue | -41.2353827 | 4.1411295 | -9.9575206 | 0.0000000 |
| cleanliness_rating | 1.9060316 | 2.6130348 | 0.7294322 | 0.4657438 |
| guest_satisfaction_overall | -0.2504983 | 0.2771879 | -0.9037127 | 0.3661561 |
| bedrooms | 74.3852759 | 3.4636747 | 21.4758264 | 0.0000000 |
| metro_dist | -32.1767754 | 2.5473590 | -12.6314254 | 0.0000000 |
| dist | 5.9211076 | 0.8914096 | 6.6424095 | 0.0000000 |
Le type de chambre, la confiance qu’ont les utilisateurs envers le propriétaire, le nombre de chambres, la distance au métro et la distance au centre ville expliquent de manière significative, au niveau 0.1%, le prix du logements la semaine. On fait le même constat pour le week-end et on observe également que le nombre de personnes pouvant loger dans l’appartement est une variable significative au niveau 10%. On peut penser que les familles et les groupes d’amis ont plutôt tendance à réserver des logements le week-end.
On souhaite déterminer si le prix moyen des logements diffère selon les différentes modalités des variables room_type et host_is_superhost.
On observe une légère différence de prix pour les maisons et les appartements privés selon que le propriétaire ait été reconnu comme quelqu’un de confiance par les utilisateurs ou pas. Quelque soit la période, ces biens ont tendance a être moins chers lorsque le propriétaire a été reconnu comme une personne de confiance.
Aucune caractéristique ne semble plus importante que les autres quand il s’agit d’expliquer la différence de prix des Airbnb entre la semaine et le weekend. On peut néanmoins noter que le week-end est généralement un moment où les utilisateurs ont plus de temps libre et peuvent voyager, ce qui entraîne une augmentation de la demande des Airbnb et donc une augmentation des prix. De plus, les hôtes Airbnb peuvent réduire leur disponibilité le week-end pour des raisons personnelles, ce qui peut réduire l’offre de locations disponibles et augmenter les prix en raison de la concurrence accrue pour les locations restantes. Enfin, les voyageurs ont souvent tendance à réserver des séjour plus longs le week-end, ce qui peut augmenter le prix moyen de la nuitée en raison de la réuction de la disponibilité des logements à court terme.
Pour illustrer nos données, nous avons réalisé une application sur R Shiny présentant sur une première page une carte intéractive réalisée avec le package leaflet. Nous avons fait un zoom sur l’Europe occidentale et nous avons représenté les clusters des locations disponibles sur Airbnb dans les 10 villes de notre base de données. Les pays sont colorés en fonction du prix moyen des locations et chaque bien est coloré en fonction de son prix. Nous avons ajouté un filtre permettant de zoomer sur la ville du pays sélectionné, un bouton pour choisir la période, ainsi qu’une barre de pricing permettant de sélectionner une fourchette de prix. Nous avons également ajouté un histogramme représentant la répartition des Airbnb en fonction du prix. L’histogramme s’adapte à la sélection. Sur une deuxième page, nous avons fait figurer un ensemble de graphes présentant des statistiques descriptives diverses et variées sur les variables.
Lien vers l’application: https://jacderennes2.shinyapps.io/r_bnb/